該解決方案有何用途?
該解決方案基於華為雲語音交互服務(wù) SIS語音識別構(gòu)建,可自動(dòng)將用戶(hù)上傳到對(duì)象存儲(chǔ)服務(wù) OBS的wav語音文件轉(zhuǎn)化為文字,並將結(jié)果存放到指定對(duì)象存儲(chǔ)服務(wù) OBS桶。該方案可以將用戶(hù)上傳在對(duì)象存儲(chǔ)服務(wù) OBS的語音文件識別成可編輯的文本,支持中文普通話(huà)的識別和合成,其中語音識別還支持帶方言口音的普通話(huà)識別以及方言(四川話(huà)、粵語和上海話(huà))的識別。適用於如下場(chǎng)景:識別客服、客戶(hù)的語音,進(jìn)一步通過(guò)文本檢索,檢查有沒有違規(guī)、敏感詞、電話(huà)號(hào)碼等信息。對(duì)會(huì)議記錄的音頻文件,進(jìn)行快速的識別,轉(zhuǎn)化成文字,方便進(jìn)行會(huì)議記錄等場(chǎng)景。
方案架構(gòu)
該方案基於華為雲語音交互服務(wù) SIS語音識別構(gòu)建,可自動(dòng)將用戶(hù)上傳到對(duì)象存儲(chǔ)服務(wù) OBS的wav語音文件轉(zhuǎn)化為文字。

語音識別解決方案
版本:1.0.0
上次更新日期:2025年3月
來(lái)源:由華為雲構(gòu)建
部署:預計(jì)10分鐘
卸載:預計(jì)10分鐘
架構(gòu)描述
架構(gòu)描述
-
創(chuàng)建兩(liǎng)個(gè)對(duì)象存儲(chǔ)服務(wù) OBS桶,一個(gè)用於用戶(hù)上傳和存儲(chǔ)用戶(hù)的語音文件,另一個(gè)用於存儲(chǔ)語音識別結(jié)果,用戶(hù)可以從該桶中獲取結(jié)果並處理
-
使用函數(shù)工作流 FunctionGraph,只需編寫(xiě)業(yè)務(wù)函數(shù)代碼並設(shè)置運(yùn)行的條件,即可以彈性、免運(yùn)維、高可靠的方式運(yùn)行
-
使用語音交互服務(wù) SIS,將wav語音文件轉(zhuǎn)化為文字
-
創(chuàng)建一個(gè)EventGrid觸發(fā)器,該觸發(fā)器關(guān)聯(lián)事件網(wǎng)格 EG,默認(rèn)創(chuàng)建一個(gè)事件訂閱,事件源為OBS應(yīng)用事件源,用於自動(dòng)觸發(fā)函數(shù)執(zhí)行相關(guān)業(yè)務(wù)邏輯